github.com/nacmarino/maR

Big data: o futuro da ecologia

  • Os dados sĆ£o centrais em qualquer tipo de pesquisa que seja realizada;
  • No cenĆ”rio atual, existe grande facilidade para armazenagem e acesso Ć  qualquer tipo de dado;
  • Integração da evidĆŖncia disponĆ­vel Ć© essencial, e serĆ” cada vez mais importante no mundo em que viveremos;
  • Big data: faz referĆŖncia ao volume massivo de dados que nĆ£o sĆ£o manuseados por ferramentas usuais de anĆ”lise de dados (ver mais na disciplina de Introdução Ć  Linguagem R), e que compƵem uma oportunidade sem precedente para o avanƧo da ciĆŖncia, teórica e aplicada;
  • Maior parte dos estudos ecológicos sĆ£o difĆ­ceis de serem repetidos (escala temporal e espacial, eventos raros, acesso aos locais,…): replicagem e reproducibilidade?

A crise de reproducibilidade

  • VocĆŖ Ć© capaz de reproduzir o achado de um trabalho que foi publicado - da produção do dado Ć  sua anĆ”lise?

Fonte: Baker & Penny, 2016, Nature, Is there a reprodubility crisis

A crise de reproducibilidade

  • NĆ£o Ć© tanto um problema do desenho do estudo, mas sim o que vocĆŖ tira dele e como.

Fonte: Baker & Penny, 2016, Nature, Is there a reprodubility crisis

Regra de Ouro (que ninguƩm comenta)

  • Integridade CientĆ­fica (Richard P. Feynman, Cargo Cult Science): tentar fornecer todos os detalhes e informaƧƵes para ajudar as outras pessoas Ć  julgar o valor da sua contribuição, e nĆ£o só a informação que o conduziu ao julgamento em uma direção ou outra.
    • Detalhes que podem introduzir dĆŗvida na sua contribuição: evidĆŖncia contra e a favor da sua hipótese;
    • Fatos que podem tornar sua contribuição invĆ”lida: outras causas que podem explicar seus resultados, artefatos que podem existir no seu trabalho;
    • Qual a evidĆŖncia sustenta os fatos apresentados pelo seu trabalho: as suas anĆ”lises estĆ£o fazendo direito o que vocĆŖ acha que elas estĆ£o fazendo?
    • As implicaƧƵes do seu trabalho estĆ£o enraizadas nos fatos que ele demonstra ou vocĆŖ estĆ” tirando coelho da cartola/usando fogos de artifĆ­cio/fazendo maquiagem?
    • Qual o limite da especulação?
  • A ideia Ć© assumir que vocĆŖ estĆ” errado, tentar enumerar razƵes para isso, e buscar invalidar todas elas.

Ainda do Feynman: "The first principle is that you must not fool yourself – and you are the easiest person to fool".

Os maiores desafios em uma RS/MA

  • Falta de clareza: estudos apresentam seu desenho de forma nebulosa;
  • Machismo estatĆ­stico Ć s avessas: AnĆ”lises estatĆ­sticas nĆ£o sĆ£o conduzidas de forma convencional;
  • Ɖ só display: sumĆ”rios estatĆ­sticos dos dados nĆ£o sĆ£o apresentados, apenas resultados estatĆ­sticos;
  • Apresentação seletiva de resultados: dados sĆ£o apresentados, mas nĆ£o seguem o desenho amostral;
  • Bomba de fumaƧa: reporta 10n resultados, que tem pouco haver com a hipótese do trabalho;
  • MĆ”gico de Oz: conclusƵes tĆŖm pouco haver (ou nada haver) com os resultados apresentados.

MudanƧa de Perspectiva

  • "Só quem passa pelo deserto sabe o valor de uma chuva": fazer uma revisĆ£o sistemĆ”tica ou meta-anĆ”lise muda a sua perspectiva de apresentação de um trabalho.

TransparĆŖncia: Escolha da Pergunta

  • A questĆ£o (ou problema) estĆ” bem definida?
  • EstĆ” claro por que a questĆ£o ou problema apresentados sĆ£o importantes?
  • EstĆ” claro como estas questƵes ou problemas sĆ£o abordados nos estudos?
  • Existe um nĆŗmero relevante de casos que possam ser usados para responder o ponto levantado?

Transparência: Seleção de Estudos

  • Quais os critĆ©rios para a seleção e inclusĆ£o dos estudos? Eles estĆ£o bem definidos?
  • Os mĆ©todos usados para a seleção e inclusĆ£o dos estudos sĆ£o justificĆ”veis e replicĆ”veis?
  • Qual a base de dados utilizada para a busca? Ela Ć© adequada? Quantos hits ela retornou?
  • Como vocĆŖ lidou com os artigos selecionados (duplicatas, mĆŗltiplos estudos do mesmo experimento,…)?

Transparência: Seleção de Estudos

  • PRISMA Statement (Preferred Reporting Items for Systematic Reviews and Meta-Analyses):
  • Fornece diretrizes para apresentação de revisƵes sitemĆ”ticos e meta-anĆ”lises de forma transparente.

Transparência: Extração de Dados

  • Principal contribuição de um cientista - agora e após a sua vida;
  • Maior parte das revistas na Ć”rea de ecologia e evolução estĆ£o requisitando o arquivamento dos dados utilizados em um trabalho publicado;
  • Algumas agĆŖncias de fomento fora do Brasil só aceitam financiar um projeto de pesquisa cajo haja um plano de longo prazo para o arquivamento dos dados;
  • Existe uma linguagem própria para o arquivamento de dados (ver mais na disciplina de Introdução Ć  Linguagem R);
  • O re-uso de dados tem algumas regras a serem seguida:
    • DĆ” crĆ©dito Ć  quem merece o crĆ©dito (seja pelo bom ou mau dado gerado);
    • Evita que um dado seja 'tomado' sem autorização (todo dado tem um DOI [ou deveria ter]);
    • Te permite verificar de forma direta o que aqueles nĆŗmeros/conjunto de informaƧƵes conta.
  • NĆ£o deveria ser um problema, mas existem alguns limites impostos por Copyright.

Transparência: AnÔlise de Dados

Transparência: Interpretação dos Resultados

Transparência: Conclusões

  • Quando usamos uma citação, estamos parafraseando o que de fato o outro pesquisador disse?
  • Estudos diferem em qualidade naquilo que mostram:
    • Em uma meta-anĆ”lise isto Ć© contemplado;
    • Mas e em uma revisĆ£o sistemĆ”tica?
  • Propagação de erros por conta de citaƧƵes erradas pode acontecer sim:
    • Erro no uso de conceitos;
    • Alteração no significado de conceitos ao longo do tempo;
    • Resultados mal interpretados;…
  • Toda a informação publicada passa a contribuir para uma 'verdade' maior, portanto tenha julgamento muito crĆ­tico com:
    • O que vocĆŖ produz;
    • O que vocĆŖ lĆŖ;
    • O que os outros dizem.

Resumindo

Literatura Recomendada

  1. Baker & Penny, 2016, Nature, Is there a reprodubility crisis

  2. Borer et al, 2009, Bull Ecol Soc Am, Some simple guidelines for effective data management

  3. Elison, 2010, Ecology, Repeatability and transparency in ecological research

  4. Hampton et al, 2013, Front Ecol Evol, Big data and the future of ecology

  5. Parker et al, 2016, Ecol Lett, Promoting transparency in evolutionary biology and ecology

  6. Zimmerman, 2008, Sci Tech Human Val, New knowledge from old data - the role of standards in the sharing and reuse of ecological data

  7. Rothstein et al, 2013, Quality standards for research syntheses, In: Handbook of meta-analysis in ecology and evolution (CapĆ­tulo 20)

  8. Lortie et al, 2013, Graphical presentation of results, In: Handbook of meta-analysis in ecology and evolution (CapĆ­tulo 21)

  9. Richard P. Feynman, Cargo Cult Science: http://calteches.library.caltech.edu/51/2/CargoCult.htm